Data besar
Data besar

Data besar

Data besar ialah bidang yang mengendalikan cara untuk menganalisis, mengekstrak maklumat secara sistematik daripada atau sebaliknya menangani set data yang terlalu besar atau kompleks untuk ditangani oleh perisian aplikasi pemprosesan data tradisional. Data dengan banyak medan (turus) menawarkan kuasa statistik yang llebih besar, manakala data dengan kerumitan yang lebih tinggi (lebih banyak atribut atau turus) boleh membawa kepada kadar penemuan palsu yang lebih tinggi.[2] Cabaran analisis data besar termasuk menangkap data, storan data, analisis data, carian, perkongsian, pemindahan, visualisasi, pertanyaan, pengemaskinian, privasi maklumat dan sumber data. Data besar pada asalnya dikaitkan dengan tiga konsep utama: volum, kepelbagaian dan halaju.[3] Analisis data besar memberikan cabaran dalam persampelan, dan oleh itu sebelum ini membenarkan pemerhatian dan persampelan sahaja. Oleh itu, data besar selalunya termasuk data dengan saiz yang melebihi kapasiti perisian tradisional untuk diproses dalam masa dan nilai yang boleh diterima.